机译:时限时间逻辑规范对连续时间马尔可夫过程控制策略的形式综合
机译:具有线性时间逻辑约束的马尔可夫决策过程的最优控制
机译:通过近似策略改进对一般Markov决策过程进行时间逻辑控制
机译:基于学习的线性时序逻辑规范的马尔可夫决策过程控制合成方法
机译:一种基于平台的线性时序逻辑规范验证和综合方法
机译:学习最大化奖励率:基于半马尔可夫决策过程的模型
机译:基于学习的方法来控制线性时间逻辑规范的马尔可夫决策过程的合成
机译:基于学习的线性时序逻辑规范马尔可夫决策过程综合控制方法。